期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于主题词频数特征的文本主题划分
康恺 林坤辉 周昌乐
计算机应用   
摘要1858)      PDF (593KB)(871)    收藏
目前文本分类所采用的文本—词频矩阵具有词频维数过大和过于稀疏两个特点,给计算造成了一定困难。为解决这一问题,从用户使用搜索引擎时选择所需文本的心理出发,提出了一种基于主题词频数特征的文本主题划分方法。该方法首先根据统计方法筛选各文本类的主题词,然后以主题词类替代单个词作为特征采用模糊C均值(FCM)算法施行文本聚类。实验获得了较好的主题划分效果,并与一种基于词聚类的文本聚类方法进行了过程及结果中多个方面的比较,得出了一些在实施要点和应用背景上较有意义的结论。
相关文章 | 多维度评价
2. ESR-Tree:一种多维对象的动态索引方法
徐焕;林坤辉
计算机应用    2005, 25 (12): 2872-2874.  
摘要1748)      PDF (745KB)(1144)    收藏
在研究SR-tree(Sphere/Rectangle-tree)和X-tree(eXtended node tree)的结构与性能的基础上,针对SR-tree分裂算法的不足,改进了分裂算法,结合两者的优点,设计了一种新的多维索引结构ESR-tree(Extended SR-tree)。实验表明,随着数据量和维数的增多,ESR-tree的性能要优于SR-tree和X-tree。
相关文章 | 多维度评价